dij 


Werkt spraakherkenning? 


Je pc als secretaresse 


“De lezer moet me maar op mijn woord geloven. Deze tekst wordt ingesproken 
vanuit mijn slaapkamer. Ik lig in bed. De pc staat ongeveer 15 m verderop in de 
woonkamer en ik praat tegen hem via een draadloos microfoontje. Ik hoop dat 
nu alles netjes op het scherm verschijnt. Ik heb me in ieder geval voorgenomen 
om deze tekst te publiceren zoals die in tekst wordt gezet vingers kruisen en 


N iet slecht. Het programma heeft “15 m” 
genoteerd, terwijl ik “15 meter” dic- 
teerde. En de laatste zin is fout door mijn 
eigen stomme schuld. Ik ben vergeten “punt” 
te dicteren na het woord “gezet”, zodat hier 
twee zinnen in elkaar vloeien. Het pakket dat we 
"gebruiken, Dragon NaturallySpeaking 8, preten- 
4 eert een nauwkeurigheid te hebben tot 99%. 
Afgaande op deze inleiding van 77 woorden, zijn 
e geneigd om dit te geloven. 
PS 

Everything is going smoothly 

in mensenheugenis bestaat het beeld van de 
hs die tegen een machine kan praten. In het 
le Griekenland waren de orakels sprekende 
den, en in 1968 zagen we voor het eerst 
oscoopprent nog wel — een boord- 
tegen gesproken kon worden. In 
dyssey’ begroette HAL 9000 


afwachten wat spraakherkenning ervan bakt.” 4 orrk scroors 


zijn commandant vrolijk met “Hello Dave, eve- 
rything is going smoothly”. Ondertussen is er 
veel bereikt op het vlak van spraakherkenning, 
maar de systemen op de gebruikersmarkt zijn 
nog beperkt. Een perfecte sprekersonafhanke- 
lijke spraakherkenner voor de thuisgebruiker 
die met verschillend achtergrondruis goed pres- 
teert, blijft uit. Of is daar onlangs verandering 
in gekomen? 

Waarom zou iemand gebruik maken van spraak- 
herkenning? Een geoefende typiste haalt 200 
aanslagen per minuut. Een spreker spreekt met 
een gemiddelde snelheid van 120 woorden per 
minuut. Wat in de praktijk neerkomt op pakweg 
600 lettertekens. Dicteren gaat dus ongeveer 
driemaal zo snel als typen. Voor wie het typen 
niet vlot, of voor wie kampt met schrijf- en lees- 
problemen, is zo’n pakket een geschenk uit de 
hemel. Iemand met woordblindheid is vele uren 
langer bezig met het verwerken en schrijven 
van een werkstuk. Wie geplaagd wordt door RSI, 
Parkinson, reuma, artrose of een visuele han- 
dicap is hiermee geholpen. Men praat door de 
headset en de woorden verschijnen onmiddellijk 
in documenten en e-mailberichten. Bovendien 


De allereerste computer met spraakherkenning 
dook al op in 1968, in de film ‘2001: A Space Odys- 
sey’. 


’s Werelds bestverkochte 
spraakherkenningssoftware 


Scanselt 


Dra ë 
Nispen 
PREFERRED WIRELESS 


Creëer documenten, e-mailberichten en 
spreadsheets eenvoudigweg met uw stem 


Vooral de draadloze headset die bij het pakket zit 
komt handig van pas bij het dicteren. 


kunnen bestaande documenten evengoed voor- 
gelezen worden. Dit gebeurt met een natuurlijk 
klinkende computerstem. Op het internet zijn 
tal van verhalen te lezen hoe mensen met der- 
gelijke problemen spraakherkenning als redmid- 
del gebruiken. Op lees je 
bijvoorbeeld hoe Henk Dalmolen sinds ’93 kampt 
met RSI, zodat hij niet meer dan 5 tot 10 zinnen 
per dag kon schrijven. Sinds hij met Dragon Dic- 
tate 2.52 werkt, kan hij opnieuw via de computer 
met de wereld communiceren. 


Soft- en hardware 


Spraakherkenning blijft een erg research- en 
kapitaalintensieve business. Alleen de groten 
kunnen er geld in stoppen. IBM investeert in 
spraakherkenning voor callcenters. Philips had 
het programma FreeSpeech, waarvan FreeSpeech 
2000 de laatste versie was voor de consumen- 
tenmarkt. Wij proberen NaturallySpeaking 8 van 
Dragon Systems uit — het bedrijf dat Lernout & 
Hauspie overnam kort voordat het ten onder 
ging aan boekhoudschandalen. De Dragon know- 
how werd overgenomen door het Amerikaanse 
ScanSoft, dat een reeks spraakherkenningpro- 
ducten voor desktopgebruik op de markt brengt. 
Het pakket wordt met een Plantronics draadloze 
usb-headset geleverd die op DECT-technologie 
werkt, met een korte oplaadbatterij waarmee je 
maximaal 9 uur draadloos met de computer kan 
communiceren. De microfoon heeft een bereik 
van 100 meter onder ideale omstandigheden. In 
kantoren mag je op de helft rekenen. Het Dra- 
gon-productgamma bestaat uit een Standard- 
(E 99), Preferred- (€ 199), Professional- 
(€ 959) en Mobile-versie (€ 299). De Preferred- 
editie verschilt met het Standard-pakket om- 


Na het Lernout & Hauspie-debacle van enkele jaren geleden werd het plots heel stil rond spraakher- 


kenning. Is de technologie een stille dood gestorven? We vertellen je er alles over in dit dossier. 


Wizard Nieuwe gebruiker 


Leerfase 


1. Praten tegen uw computer (informatief) 


Lees de volgende alinea voor: 


Wanneer mensen met elkaar praten, maken zij gebruik van een 
groot aantal vaardigheden om te begrijpen wat er wordt gezegd. 
Mensen lossen ingewikkelde spraakherkenningsproblemen zonder 
moeite op. Hieronder volgt een korte beschrijving van een aantal 
belangrijke spraakherkenningsproblemen, waarbij we een 
vergelijking maken tussen de manier waarop mensen en 


computers die problemen oplossen. 


Begin EEETENEE EEN E Een nnn nen 


Pauze | <- Opnieuw | 


Overslaan -> | 


< Vorige Volgende> 


dat die dictaten kan afspelen, samenwerkt met 
een handheld-recorder en voorzien is van Real- 
Speak2 tekst-naar-spraak. Met de Professionele 
versie kan je meerdere eigen woordenlijsten 
opmaken, audio met tekstdictaten opslaan en 
genieten van intelligente opmaakmogelijkheden. 
In de doos van NaturallySpeaking 8 Mobile zit 
de Preferred-editie en een digitale zakrecorder 
met koppelingssoftware. 


Ga slapen en word wakker 


Om te beginnen moet de applicatie aan je stem 
wennen en wordt er per gebruiker een stem- 
profiel bepaald. In dit stemprofiel wordt het 
timbre van de stem, de eigenschappen van de 
microfoon en eventuele ruis van de werkomge- 
ving vastgelegd. Daarom zal je een kort tekstje 
voorlezen dat op het scherm verschijnt. Na on- 
geveer een minuut klinkt er een zachte biep, 
zodat je kan overgaan tot de tweede stap. In 
die fase wordt je schrijfstijl geanalyseerd. De 
harde schijf wordt gescand op e-mail-, Word-, 
Word Perfect- en andere tekstbestanden opdat 
de spraakherkenning zich je stijl eigen kan ma- 
ken. Vanaf dan is het programma klaar om aan 
de slag te gaan. Of de gebruiker er klaar voor 
is, blijft de vraag. Die moet zich aanpassen en 
een reeks commando's leren om optimaal van 
de software gebruik te maken. Gelukkig volgt er 
een interactieve rondleiding, waarbij je monde- 
ling menucommando’s leert ingeven, tekst cor- 
rigeren, de cursor verplaatsen, opmaak wijzigen 
en passages verwijderen. 

Uiteraard kan je steeds tekst corrigeren met 
behulp van het toetsenbord, maar het is in- 
teressanter om dat via spraakopdrachten te 
doen. Stop je handen in je broekzakken en 
commandeer “Selecteer” of “Corrigeer”. Dic- 
teer vervolgens de foute tekst, en er verschijnt 


we | 


aanpassen. 


meteen een lijstje met alternatieven. Ofwel zeg 
je “kies 4” wanneer het vierde alternatief juist 
zou zijn. Staat het correcte woord niet in de 
lijst, dan commandeer je “Spel dat”, waarna je 
het woord letter per letter in een dialoogven- 
ster kan inbrengen. 

Heel interessant is de functie DicrAAT AFSPELEN. 


TOEKOMSTPERSPECTIEF 


Dat we in de toekomst met computers zul- 
len communiceren via spraak wordt door 
sommige experts tegengesproken. Temeer 
omdat wetenschappers hebben ontdekt dat 
een mens niet goed kan nadenken op het 
moment dat hij spreekt. In een recent in- 
terview met de Washington Post stelt Ben 
Schneiderman van de universiteit van Ma- 
ryland dat een eenvoudig gesproken com- 
mando als “page down” zoveel geheugen 
in de hersenen in beslag neemt dat het 
moeilijker wordt om je te concentreren 
op de taak waar je mee bezig bent. Bij 
motorische activiteiten zoals klikken met 
een muis (oog-handcoördinatie) wordt een 
ander gedeelte van de hersenen gebruikt 
dan bij spraak en ontstaat er geen conflict 
met het nadenken over de taak die je wil 
verrichten. Om die reden zullen we in de 
toekomst computers besturen via visuele 
tools. 


VAKTAAL A-M N-Z 


RSI: Repetitive Strain Injury. Als je veel dezelfde beweging 
uitvoert — bijvoorbeeld het gebruiken van een muis — dan 
kan je na een tijdje aan RSI beginnen lijden. Je krijgt dan 
bijvoorbeeld pijn in je arm, elleboog of schouder. 
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Door voorbeeldtekstjes in te lezen, 
kan de software een stempro- 
fiel aanmaken en zich daar aan 


Vloeiend spreken 


Wij kunnen de software slechts aan een kleine 
test onderwerpen, dus gaan we op zoek naar 
doorwinterde gebruikers van spraakherkenning. 
Dirk De Ridder is technisch adviseur en gebruikt 
het Lernout & Hauspie-pakket Voice Express 8 
Professional. 


Clickx: Hoe lang gebruik je al spraakherken- 
ning? 

Dirk De Ridder: Ik denk ongeveer 5 jaar. Als 
inwoner van Brasschaat konden we het destijds 
voor een goeie 10 euro bij de gemeente aan- 
schaffen, inclusief een microfoontje. 


Clickx: Werkt het naar jouw gevoel nauwkeurig 
genoeg? 

De Ridder: Na verloop van tijd wel. Achteraf 
laat ik de tekst natuurlijk doorlopen door de 
spellingscorrector van Word, en dan mag het 
resultaat gezien worden. Je moet jezelf natuur- 
lijk de tijd geven om het programma naar je 
hand — in dit geval je stem — te zetten. Ik heb 
gemerkt dat je het beste resultaat krijgt als je 
de tekst vloeiend inspreekt en dus niet als een 
schoolmeester woord voor woord dicteert. Ik 
maak er vaak gebruik van om verslagen op te 
stellen, maar voor ik dat kon heb ik wel een hele- 


Hiermee kan je een regel, een alinea of een 
heel document laten proeflezen. Het programma 
markeert tijdens het afspelen waar je op dat 
ogenblik bent. Op die manier kan je makkelijk 


AMA... JE MAALT 
MC DE WOORDEN 


JAKKES.. WAT EEN MORMEL «-- 


boel technische termen aan het lexicon moeten 
toevoegen. Ik heb nooit echt leren typen en op 
deze manier boek ik behoorlijk wat tijdswinst. 


Dirk zet zijn headset op en dicteert: “Ik probeer 
nu een nieuwe zin te formuleren.” Het resultaat 
is perfect. Wanneer ik de headset overneem en 
hetzelfde dicteer, lukt het niet. Zelfs niet na vijf 
pogingen. Het beste resultaat is “Ik probeer nu 
wie verzint te formuleren.” 


Clickx: Waarom begrijpt het programma mij 
niet? 

De Ridder: “Het programma volgt mijn per- 
soonlijke stemanalyse. Als jij ook teksten wil 
dicteren, zou je eerst de gewenningsprocedure 
voor nieuwe gebruikers moeten doorlopen. 


Clickx: Wat zijn de dingen waar je vooral op 
moet letten? 

De Ridder: De stand van de microfoon is be- 
langrijk. Hij moet naast en niet voor de mond 
staan, anders hindert het geluid van de ademha- 
ling teveel. Het is niet nodig om achtergrondmu- 
ziek uit te zetten. Wanneer ik het programma 
aanzet, wordt de opnamekwaliteit nagekeken. Je 
moet vooral volhouden en doorzetten. De gemid- 


je werk nakijken. Wanneer je een fout opmerkt, 
zet je het dictaat stop en wordt automatisch het 
snelcorrectiemenu geopend. Uiteraard moet je 
ook de leestekens dicteren. 


II 


SPEELGOED MET SPRAAKHERKENNING 
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Dirk De Ridder gebruikt al jaren spraakherken- 
ningssoftware: “Het is belangrijk dat je vloeiend 
spreekt en niet woord voor woord dicteert.” 


delde computergebruiker wil liefst zonder de 
documentatie te lezen en zonder oefening snel 
aan de slag. Pas door training en geduld zal je 
iets met spraakherkenning kunnen doen. 


Dat het programma niet alleen teksten neerzet 
maar ook Windows bestuurt, kwamen we snel aan 
de weet toen we een beetje slordig “punt” dic- 
teerden en ongevraagd het Print-dialoogvenster 
zagen verschijnen. Om te vermijden dat het pro- 
gramma je conversatie met de koffiemevrouw op 
je bureaublad neerzet (de usb-microfoon heeft 
inderdaad een bereik van 50 meter en meer), 
commandeer je gewoon “Ga slapen”. Achteraf 
maak je het herkenningsysteem weer wakker 
met “Word wakker”. 


Met de handen in de zakken 


Aanvankelijk zijn we ontgoocheld over de massa 
misverstanden, maar dat heeft meer te maken 
met het ongeduld waarmee we het pakket op 
de proef willen stellen. De microfoon moet eerst 
voldoende opladen. We moeten de noodzakelijke 
commando's leren én de tijd nemen om het 
programma een aantal woorden aan te leren. 
“Clickx” werd aanvankelijk als “Klik is” gespeld, 
totdat we de naam van dit blad aan het lexicon 
toevoegden. In het lexicon-venser tik je eerst 
het nieuwe woord in en daarna spreek je het 
uit. Vanaf dan wordt dezelfde fout niet meer 
gemaakt. Voor eenvoudige teksten blijkt de pre- 


IPOD-TOETJE 


Wie een beetje met de iPod vertrouwd is, 
weet dat hij deze mp3-speler kan uitbrei- 
den met een klein microfoontje. Wij pluggen 
zo’n Belkin-microfoontje op de iPod zodat 
die kan dienen als digitaal opnameapparaat. 
De kwaliteit van de iPod als dictafoon is ove- 
rigens voortreffelijk. We leggen we de iPod 
op tafel en spreken een tekst in. Vervolgens 
koppelen we de iPod aan de pc en bewaren 
het wav-bestand op de harde schijf. Wanneer 
we dit wav-bestand proberen te openen met 
NaturallySpeaking 8 lukt dit niet, omdat het 
geen 16-bits mono-bestand is en een ongel- 
dige sample rate heeft. Daarom downloaden 
we een stukje freeware, Switch van www.nch. 
com.au, en converteren dit bestand (551 KB) 
naar 16-bits mono. Dit vergt maar enkele 
seconden. Vanaf dan laat het bestand zich 
wel openen door NaturallySpeaking, zodat we 
interviews en gesproken herinneringen auto- 
matisch kunnen laten uitschrijven. Het enige 


cisie van het programma meer dan behoorlijk. 
Naarmate we oefenen en gebruik maken van 
het Nauwkeurigheidscentrum, stijgt de preci- 
sie. Het Nauwkeurigheidscentrum is een inge- 
bouwde startpagina met hulpfuncties en tips om 
spraakherkenning te verbeteren. Bij technische 
teksten blijft het verbeteren en het ingeven 
van de juiste termen wel frustrerend veel tijd 
in beslag nemen. 

Wie dure tijd investeert in spraakherkenning 
mag niet krenterig doen over de microfoon. 
Een goedkoop staafmicrofoontje of een toestel- 
letje dat je gebruikt voor internettelefonie pikt 
te veel omgevingsgeluiden op. De Plantronics 
CS60-headset zit erg comfortabel en is compleet 
ongevoelig voor stoorgeluiden. We kunnen zelfs 
perfect in de woonkamer dicteren terwijl op de 


Als het spraakherkenningsprogramma zijn werk goed doet, moet 
je je toetsenbord nauwelijks nog aanraken. 
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Met deze kleine uitbreiding van Belkin maak je 
van je iPod in een handomdraai een dictafoon. 


(ernstige) nadeel is dat de tekst doorlopend 
wordt neergepend. 

Deze truc lukt trouwens met alle opname- 
toestellen die bestanden in het wav-formaat 
wegschrijven — desnoods moet je een gratis 
audioconverter gebruiken. 


achtergrond de televisie staat te loeien. 

Het programma werkt goed samen met alle 
Microsoft-toepassingen. Het bevat bijvoorbeeld 
standaardopdrachten voor de courante e-mail- 
programma’s. Zelfs MSN Messenger-boodschap- 
pen opstellen is geen enkel probleem — zo wordt 
chatten opnieuw babbelen. Je kan Naturally 
Speaking ook gebruiken om Internet Explorer 
te besturen: je noemt gewoon de naam van de 
webkoppeling om van de ene pagina naar de 
andere pagina te surfen. Wil je een internet- 
adres in het adresvak invoeren, dan dicteer je 
eerst “Ga naar de adresbalk” en vervolgens “Ga 
naar adres www.huppeldepup.be”. Met bevelen 
als “schuif omhoog”, “sneller” en “stop met 
schuiven” bedien je de scrollbalk. Werken met 
Excel is dan weer een complete tegenvaller. 
Cijfers, zelfs in de nummermodus, worden als 
tekst ingevoerd, zodat je de gegevens niet voor 
berekeningen kan gebruiken. 


Lange leerschool 


Kathleen De Greve is arts in een ziekenhuis te 
Antwerpen. Ook zij heeft lang gebruik gemaakt 
van hetzelfde Lernout & Hauspie-pakket. “Ik 
vond het erg handig om mijn brieven te dicte- 
ren omdat ik in die periode net op een dienst 
stond waar veel administratie moest verwerkt 
worden. Achteraf moesten we die tekst doorge- 
ven aan de secretaresse die ze vorm gaf. Op die 
manier moest ik me niet bekommeren om de 
vormgeving.” Voor De Greve was het dus niet 


Kathleen De Greve: “Het trainen van de software 
duurde eindeloos lang. Ik mag er niet aan denken 
dat ik na een crash opnieuw zou moeten beginnen.” 


nodig dat elk woord perfect genoteerd werd. Het 
allergrootste nadeel vond ze het trainen van de 
software: “Het duurde eindeloos lang voor het 
programma op mijn stem afgestemd was. Ik heb 
echt veel oefenteksten moeten voorlezen. Bo- 
vendien heb ik zeker vier avonden gespendeerd 
om het pakket te trainen. In het begin heb 
ik al de nodige medische termen toegevoegd. 
Het moest bovendien in een geluidsstille kamer 
gebeuren, of het programma was helemaal in de 
war. Ik moest er dan ook nog aan denken om 
traag en vlot te spreken om het beste resultaat 
te verkrijgen. Ik mag er niet aan denken dat 
ik na een crash helemaal opnieuw zou moeten 
beginnen. Maak dus zeker een back-up van je 
eigen lexicon!” 


SAMENGEVAT 


Voor mensen met ernstige RSI-klachten, 
dyslexie of een visuele handicap is de over- 
gang van handinvoer naar spraakherken- 
ning een must. En wie traag typt, kan 
eveneens profijt halen uit deze toepassing. 
Toch heeft het gebruik van spraakherken- 
ning ook nadelen. Het gaat niet vanzelf. Je 
vervangt niet zomaar het klavier door de 
headset. Het vergt een heel andere manier 
van werken en vooral geduld, doorzet- 
tingsvermogen en zelfdiscipline. Zo ligt de 
productiviteit gemiddeld lager en is het 
aanleren van spraakherkenning een lang- 
durig en intensief proces. « 


